0 ۱ 


۹ 1/6۰1۴ ۲۱088۵۵۵۵26۰ سب -< 


16096026 ۲ 
۲۷۵], 12 ۷0۰ 4, 2022, 0. 543-8 0 


0۵۵۵۳ 1۸۵۵۵۲۵۸۵۸۵۱۵ 0 ۷۱۵۱۵ عظ) ۳۳۵0100۵۵ ۲۵۲ ۱۷۲۵0۵ م0۱۷۵ -۱(۵)۵ خر 
6( 
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فصح عمممنمک ۵۶ لته نصا صقد رعصتهم‌صتع لمتمومکم که اممطمی ,همع اصممم‌مصه۱ . وزتامتالمرظ رتصعل‌بتو ۷۲80 -1 
صق مصحتطه 1 رپرعمامصطمع] 

4ص ومصمزمگ ۵۶ بانیه نصا صحا رمدتهممتعمظ منونمم که اممطمی رتصمصنهمونا اصمصم‌مممه ۱ ازتامنال۵:ظ رتمووع]۲:۵ اصداولوو۸ -2 
صق مصحتطم 1 رپرعمامصطمع] 

۶ ۱۷۵۹7 صحیا بعمته‌ممتعمظ دعقم ۵۶ اممطمگ رتصم‌نهمون ممتههمصنع‌ عمتمصصصمنن مه صماولرگ ,۲۳۳۵16950۲ تصداولوو۸ -3 
صح رمحتطه 1 ,بوعمامصطعع۲" 4صه ٩61۵6‏ 

(۵106).26.11 حصتصقحطا :تم عمط نم عصتل‌مممومتومن) -۲) 

4 و و( 


۰ ۱ ماه 0 ۲۱۵۷۲ 12-041 :16661۷60 

عصتاه‌ن۳:60 10۲ ۱۲۵061 موب زتل-حاع< ۵ .(2022) ۷۲,۰ ,انعم عک .]1.۷ متصقفطا ,.۲ رهم۲۸06 09-06-01 :16۷1560 

,24 ۵6۱۱ یت( وه ول .مصهمتهعناگ طم تمعناد ماطامتع۲۵60۷ ۵۶ ۷1۵۱0 عطا 14-07-01 :0عاوعععظ۸ 
4 ۱ .۰ (۲2»00)وطاه طوتاع و طاز۳ مفتوعظ م) ,5343-558 ...14-07-2021 :عصتلمن0 ماصاوآتوب۸ 


(1۱۹000۰۵00 


۵۵۵ فا م1 پرمصم101ناوا۵و مه تنم مصتفمعتع1 صرح امنتميم تمتااتام‌تتيه ملععاه0و 2 و1 مصههتهمع نا 
0ص عتافصتاه ععلناً متمامع منامتنه ۷ .تقوناه وا مصهعتقعبه ۵۶ ]مبالم۲0ج اصماعممرصظا اومصظر م1 .عم8صه)عممظ ۵60121 ۵1 و1 
عطا 0۶ مه و1 هصتاه101662 ۷1۵۱0 0۲۵۵ ٩۱0۵27.‏ ۲۵۵0۷۵۲۵۵16 4ص مصهمعهعداه 0۶ ۷۱۵۱0 عط )2160 فعمتانصمی اصعصصعع‌مص۳2 
اممداه )مت0متم طامتقجظط رلامذ متقصصتاوع ما 8۵0 وا متا رعتتلنام‌تنيه صملفتهعتم صا وملمها. اصقا0۲حرصصا )و۱۵ 
مط م۵0 مضه )۳۵016 ۵ و1 تاه فتطا ۵۶ عوممتام م1 .منم مفوعتمصد مه م0۳00 معقصقمظ 20 6820 
-2810 2۵اه ۸-101۲ ۵1 مه مط مد رتقفیه ماممه۵۵۷ع۲) مصهم‌تموباه مم مها تقعباد وصتامع]2 1201019 
0۰ع مطمتندع1 ممتطمفصه منوا مممااميم صقاوع2بطک ۵۶ دمم وتافتالظ1 


۱۷۲۵۸)۵۳1215 20 ۵۹ 


حصم مماده2طک1 ۵۶ ممصزبميم فط ما عاصاهک-تصه وصمم‌می قداص موه فط مصرم مق ,باه فتطا امنامجمع 10 
حصع 20 0۳00 رلا۵و رمعلفصتلن تماق 01 قاعو سبام] متامص1 طمنط/۸ 1۳۵۵۵۲08 3223 فقط 02102 و1 .9۵60 ۷۷۵۲۵ 2017 10 2010 
جمتاملمتج ملسامصا مماطمتنه۷ مامه‌وزنا. ,وماطهتته۷ ماعععونل لمع فیامتمتاومع . وملباامصا_هلق _ فتط1.. ,اصعصم‌عه‌صم 
قامصتاومن) بصمتاهع تا ومصصتا صرح اوع۷تقط ۵ طصمصد فطا ررفعقاه مصهع) هه ,ما۷2 رصق بع۵ا 5011 رتصعصصعع ۳۵8۵ 
بطمنامصاوصمی ۷۵۲ ماما رمعفاهعط هم ممتام‌حصاوومی تمه بمتام‌صتاوومع ۲م2تتاعع1 ل2متصصمده رهعته 6امصا ومامامتته۷ 
۵۲۷6۵ (0ه ما 0 عصاری لهعماصا فصن تام بنظ ارهز (قامدرر مصهع) ۷۱۵10 رصمتاهتت. صمعقعو و۵ رصئقت 
٩۵۵۵0 2۵0 6۷۵۵0۲۵000 46‏ 1۵0 ,اتتصصیاط ۵120۷۵ یقمهر صع صتصظ. رمتتااههمعا تفص مه صنص. رطمتاهااض0۳60 
صقط تماجعتم ومباله۷ روعووهاه ۳۵ مفصا ۷1060 و1 جرج ماطاهتنه۷ )معتها مط قه 106۲60قو۵ و1 ماماهتعه۷ تقعناه ماطاقته۲۵۵۵۷ 
هه معاصامتیه۷ تعطاه م1 .وفقاه قاطاهعلمع0صه فطا صر وج 9 صقطا فوق1 مضه ففقله لقصصتامه فطا صا عم 9 هه لقتاوع ۵0۶ 
ماص 01060 امد مع میج عطع 0مظ)عهصه )با۳۱۵۱0۵ قط) عصتعدا عصتامه0م ت۲۵ .عماصهلنه۷ 0۲۵010)0۲ قه ۲60عقفههم 
5۲ ۱60 ۷۷۵۲۵ ۲6۵۵0۵۲05 2256 وع0بامصا طمتطه ملقل فطا ۵۶ 7070 .566 ]1۵9 2 هه 56۲ عصنصتهتا ۵ رقاعه )صعلمع1۳06۵ ۷۵ 
٩00۷۲ ۵۵‏ عنطا ۵۶ عصتاع0مه م1 .عصتادعا 10۲ ۵6۵0 ۷/۵۲۵ ۲۵۵۵۲05 967 وع4باامط1 طمنط/۳ 0212 مطا ۵۶ 3096 24 عصتصتهه 
حصمصفک اصممصرمرمد هه ع۵)۵0001ظ فارصنا مط ما 3.8.6 صمیوه۷ عمهناع‌مصه1 عصتصصصهتومن ممطظ فطع ده مهم 
۵۰ 10۲ ۱۵۹60 ۱۷۵۲۵ فصصطاتتمعله (مصتطمفمظط ۷۵۵۵۲ 8۱۵۵۵۲۲) 5۱۷۲۷۲ 20 ]20۳005 ,]۸020005 ,۲0۲651 


166165 20 (6) 


۰ ۷۷۵۲۵ ۷۵110210101 5و0 ۱۵010 200 560۲۵ ۶1 رلله6ع۲ رطمئفتهع ,هام26 ۵ وعتتامجط رواعلمصظ مط) ماقتاله۵۷ 110 

۵ 260007207 92.466 هد اع0مصه ]و0مها42ض فط) صه )6و عصتصتهط عمط هم دهع 94.86 طاذ۳۷ 2۵061 20۳005۲ 196 

مج 0۳6618108 879۵0 ۷۷1 2۵061 ۸4200051 وعتتامجظط 6201ع۲ فصه صمنفتمعتم من 860ظ ,۵0615 )وه عط 27 ,56 91ع) عطا 

10-0 062۱64ع۴ وه 860ظ ,۱۵0618 تقطاه فطع صقط ممصقمطمگتهی ععااعه 2۷۵ 16۵21 87۵ 1/8 ۵081 5۱۷۸۲ 

6 ۵06۱ ]وع۵ فطا فد «محتتهع2 92.390 ۳1/8 ۵061 ۱۷۱۷۲ قظ) فقعوع: ۸۵ عصلوتا ممتاهلناه۷ وومت ٩0۳20160‏ 

اصهاعمرحصا اومحظ مصا مه ممتاهتنل ممقوعی وم 24 )و2۲۷۵ وم مه ۵ فاص محصتا رتسم 0۶ وعامامت۷2۲ 
۰ ۲۵۵0۷۵۲۵۵01۱6 6 عصتام0۲601 طاً ۱۷۵۲1۵0165 


2۳۴ نشریه ماشین‌های کشاورزی. جلد ۱۲. شماره ۰۴ زمستان ۱۴۰۱ 


صمتعصل‌صم) 


بهعناه مامه۵۵۷۵ع۲ عمتام‌ت0ه 10۲ فلمصامصه ممترنهع۱ مصتط‌مصهر وم 0مقهها طمهمعومه سفص و 0و فتطا 1 
۶ نموم میاممصهانصدله مطا ود رتاو عنطع ۵ ممتاجمصطا صما۲ممرصطنا اقمصظر فظ1 ,مصعوعتم ۳2۵ ۱02216200 
0 عصنام۱۵0 10۲ ممتافتم‌امههطه مومت 200 رم مه طماو وعمامه قطان طا1 عصماه روتماع12 متلقصصتاه 4صه صعجصمع۳2۸۵۸8۵ 
ال 0۶ وعصمصصمو مطا نقطا ماو فااناوع فط1 ,عصهمتهونه هم ممفامهمهه بقوناه ۲۵۵۵۷۵۲۵۵1۵ مطا ممتاهع11وعهاه 
۱۵ ۱۷۹۵0 06 موه محصطتيمعاه عصتصنجعا ماماصصمعمه مه و0مصامصظ هدع مصتط‌قصه مضه ماصامام6عع2 و1 82۵015 
ص ۱۵06 ۳۵65 0601910 ۵۶ 561 عمط حصم 0عصتقاهان وملنا فطا ۵۶ فتوولممه عمط مه ناه ونط گم فاناوع۳ م1 ,۷۱۵10 6۲0۵ 
ملمتم200۳۳0 عصتصتصمامل ما فمتتامنلم موه ما۵ مه‌عمصممه عم ۵0ونا وه صقه. أم0مصه )و۵۲۵ رمل‌صه فطا 
0۵0۵1 2001676 ما فصمتاتجمی مطا عصتتهومتم 0ص وعلع۹0216 

موه مصه‌تهوناه لماک تمد عم‌لفمه ممتوتهع0 مه عمللفهه متام وج ۷۵ وج طمتهعوع تباب ۲۵۲ 
0 ۲65۱۱۱۹۰ ۲6112016 ععمصظ صتفاهاه مه 960 و0 صقع فماممصهو معمحظ :م۵1 مه فهمتادم‌عوناه عط101100/1 عطا پرصحم‌من 
6 ۱۵ )ممصصم‌تنامع 101 ۵۶ عون۱۲ .عط٩وععمم‏ فص مه فلورلقصه فمزیعو عصصل) ردول مامح عصنصنجع1 ومعنا ۱۷۵60 ع۵ وم 
مه افال‌ص- موه مصهمهمناه 201۲ک1- تمه من ماه عصلوومعمنم مصصتا- ۲621 200 


نموه مملوهع۳ رعصتام ۱۷۵0 رعمتصهع۱ مصنطمه۷ رجمتاهه 012991 1۵۲۱۷۵۲۵۵۰ 


نشریه ماشین‌های کشاورزی 


(9 1۳ 


۳۳ 


انجمن مهندسان مکالیک اپران 


جلد ۱۲. شماره ۴. زمستان ۱۴۰۱ ص ۵۴۳-۵۵۸ 


ارائه مدلی داده‌رانه برای پیش بینی عملکرد شکر استحصالی از نیشکر 


فاطمه نادرنژاد دین محمد ایمانی 4۵*۲ محمدرضا رسولی ۳ 


تاریخ دریافت: ۱۴۰۰/۰۱/۲۳ 


تاریخ پذیرش: ۱۴۰۰/۰۴/۲۳ 


چکیده 


پیش‌بینی عملکرد محصول یکی از مسائل مهم در حوزه‌ی کشاورزی می‌باشد و به عوامل مختلفی از جمله شرایط آب‌وهوایی. ویژگی‌های خاک 
ویژگی‌های محصول و برنامه‌های مدیریتی وابسته می‌باشد. پیش‌بینی دقیق عملکرد محصول می‌تواند در تصمیم‌گیری‌ها و بهینه‌سازی فرآیندها به 
کشاورزان و صنایع وابسته به کشاورزی کمک نماید و در نهایت منجر به افزايش تولید شود. نیشکر یکی از مهم‌ترین محصولات استراتژیک کشاورزی و 
منبع تأمین شکر در جهان می‌باشد. هدف پژوهش حاضر پیش‌بینی و بررسی عوامل موثر بر میزان شکر استحصالی از نیشکر در مزارع شرکت 
کشت‌وصنعت نیشکر امیرکبیر با استفاده از الگوریتم‌های یادگیری ماشین می‌باشد. داده‌های جمع‌آوری شده برای این پژوهش مربوط به بازه زمانی 
سال‌های ۱۳۸۹-۱۳۹۶ شامل ۳۲۲۳ نمونه می‌باشد که شامل چهار محموعه داده آاب‌وهوایی» محصول. خاک و مدیریت مزرعه می‌باشد. برای مدل‌سازی 
پژوهش از الگوریتمهای جنگل تصادفی, آدبهست, تقویت گرادیان حداکتری و ماشین بردارپشتیبان استفده شده و در محیط ژوپیترن وت‌بوک پایتون 
پیاده‌سازی شده‌اند. مدل جنگل تصادفی با صحت 48۲/۲ برای پیش‌بینی شکر استحصالی در بین مدل‌های ارائه شده بهترین عملکرد را دارد. 


واژه‌های کلیدی: طبقه‌بندی کشاورزی دقیق» مدل‌سازی, یادگیری ماشین 


مقدمه 


کشاورزی نقش مهمی در اقتصاد جهانی دارد و موادغذایی مورد 
نیاز انسان را تآمین می‌کند. با افزایش روزافزون جمعیت جهان و به 
دنبال آن افزايش تقاضا برای موادغذایی فشار بیشستری بر سیستم 
کشاورزی و منابع طبیعی وارد می‌شود. ورود تکنولوژی‌های جدید در 
بخش کشاورزی در طی قرن گذشته و در طول انقلاب سبزء به 
ورین گیگ کون که هام با قاضای اهر ال فد واه غاابن و 
سایر محصولات باشند. تکنولوژی‌ها و رویکردهای جدید می‌توانند 
اثراث زیست‌محیطی کشاورزی را شناسایی و با حفظ یا کاهش آن» 
نیازهای غذایی آینده را برطرف کنند. فناوری‌های نوظهوری همانند 
اینترنت اشیاء تجزیه و تحلیل کلان داده‌ها و هوش مصنوعی 
می‌توانند در تصمیم گیری‌های آگاهانه مدیریتی با هدف افزایش تولید 
محصولات استفاده شوند (2020 م,طعصل۹ عک ,رفظ بهن‌مطوز8). 


]این دانشجوی کارشناسی ارشد» گروه مدیریت بهره‌وری» دانشکده مهندسی صنایع» 

- استادیار گروه مدیریت بهره‌وری» دانشکده مهندسی صنایع» دانشسگاه علم و 

صنعت ایران» تهران» ایران 

۳- استادیان گروه مهندسی سیستم‌های هوشمند دانشکده مهندسی صنایع. دانشگاه 

(#- نویسنده مسئول: ۴ )۵106 حصتصفهط] تأتمصط) 
4 و ۵( 


کشاورزی دقیق که امروزه کشاورزی دیجیتال نامیده می‌شود مستلزم 
استفاده از مجموعه‌ای از اين فناوری‌ها برای بهینه‌سازی نهاده‌های 
کشاورزی برای افزايش میزان تولید کشاورزی و کاهش اتلاف‌ها 
می‌باشد. کشاورزی دقیق زمینه‌های علمی جدیدی را به‌وجود آورده که 
با استفاده از رویکردهای داده‌محور منجر به افزایش بهره‌وری در 
کشاورزی شده و اثرات زیست‌محیطی آن را به حداقل می‌رساند. 
داده‌های تولید شده در عملیات کشاورزی مدرن توسط انواع مختلفی 
از حس‌گرها جمع‌آوری می‌شود که درک بهتری از محیط عملیاتی 
محصولء شرایط خاک» شرایط آب‌وهوایی 9 داده‌های مربوط به 
عملیات ماشین‌های کشاورزی را ایجاد می‌کند و منحر به 
تصمیم گیری‌های دقیق‌تر و سریح‌تری می‌شود ( ,۱5260ظ ,12105 ] 
8 ,001 عک ,۳625028 ,دا۷]09۳0). پیش‌بینی عملکرد 
محصول یکی از مهم‌ترین موضوعات در کشاورزی دقیق است. که 
برای نظارت بر عملکرد» تخمین عملکرد. تطابق عرضه محصول با 
تقاضا و مدیریت محصول برای افزایش بهره‌وری» استفاده می‌شود و 
از اهمیت بالایی برخوردار می‌باشد (2018 ,.۵1 6 12105 هم‌چنین 
پیش‌بینی عملکرد محصول یکی از مسائل چالش برانگیز در کشاورزی 
دقیق می‌باشد و تاکنون مدل‌های زیادی برای آن ارائه و تایبد شده 
است. این مسئله نیاز به استفاده از چندین مجموعه داده دارده زیرا 
عملکرد محصول به عوامل مختلفی از جمله شرایط اقلیمی. 
ویژگی‌های خاک» کودهای شیمیایی و نوع محصول بستگی دارد. 


۵۳۶ نشریه ماشین‌های کشاورزی. جلد ۰۱۲ شماره ۰۴ زمستان ۱۴۰۱ 


بنابراین می‌توان گفت پیش‌بینی عملکرد محصول کار ساده‌ای نیست 
۳ مراحل پیچیده‌ای دارد که باید بر اساس داده‌های موجود حل شود 
(2020 ب,لمعت عک رصتاطحوعهک رم تاطاجهم‌صماکا 2 ۷) 

ابزارهای داده‌کاوی و یادگیری ماشین می‌توانند داده‌ها را تحلیل و 
عوامل موّثر بر عملکرد محصول را شناسایی کنند. داده‌کاوی فرآیند 
مجموعه داده‌ها و تبدیل آن‌ها به اطلاعات قابل فهم می‌باشد 
(2013 ,صحطلته ۷ > طوعحصق؟1). یادگیری ماشین شاخه‌ای از هوش 
مصنوعی می‌باشد که تمرکز آن ایجاد توانایی یادگیری در ماشین‌ها 
بدون دخالت انسان و برنامه‌ریزی دقیق می‌باشد. فلسفه یادگیری 
ماشین بر این است که آینده به گذشته بسیار نزدیک می‌باشد» بنابراین 
مدل‌ها بر اساس داده‌های گذشته ساخته 9 آموزش داده می‌شوند و بر 
اساس آن‌ها آینده پیش‌بینی می‌شود. مدل‌های یادگیری ماشین باتوجه 
به هدف مسئله می‌توانند پیش‌بینی کننده یا توصیفی باشند. برای 
کسب دانش از داده‌های جمع‌آوری شده و توضیح آن چه اتفاق افتاده 
است از مدل‌های توصیفی استفاده می‌شود. در حالی که از مدل‌های 
تیش بیتاتته پسر اج شین آنتله ابفانصمس شسود ( 9 
0 .۵1 6 عتناحاجهجط۱0۲>). 

نیشکر یکی از محصولات استراتژیک کشاورزی و یکی از 
مهم‌ترین گیاهان قندی در جهان محسوب می‌شود. اين گیاه پتانسیل 
تولید شکر با کیفیت بالا و به مقدار زیاد در واحد سطح زمین را دارد. 
اصلی‌ترین محصولی که از نیشکر استحصال می‌شود شکر است. مقدار 
شکر استحضال شنده پرای هر رقم تیشکر با توجه به شرایط جفرافیایی 
تن نی متفاوت است. قیمت بسیار ارزان شکر در مقایسه با مقدار 
کالری که ایجاد می‌نمایده شکر را به‌عنوان یکی از منابع غذایی انسان 
تبدیل کرده و نقش مهمی را در سبد مواد غذایی ضروری مردم جهان 
دارد. به طوری که ۵/۲ درصد از کل تولیدات غذایی جهان به نیشکر و 
چغندر قند اختصاص دارد. در مقیاس جهانی عملکرد قند چغندر قند و 
قند نیشکر در واحد سطح تقریباً مساوی است اما هزینه تولید نیشکر 
معمولاً کمتر از چفندر قند می‌باشد ع ,صهنمصطه ,نتهاطهممطع) 
(2008 ,۸۰1122 بر اساس آمارهای موجود» شکر تولید شده در جهان 
تقریباً ۰ درصد از نیشکر و ۲۰ درصد از چغندر قند به‌دست می‌آید 
(2020 بعمله ۷۷ :.0.ظ راقات۱۷]2 کهعناو مظ [). 

با توجه به این که نیشکر در مناطق گرمسیری و نیمه گرمسیری 
دنیا و در حوالی مدار ۲۶ درجه تا ۲۴ درجه و ۴۵ دقیقه شمالی می‌روید 
منطقه جنوب ایران و استان خوزستان منطقه مساعد برای کشت این 
گیاه محسوب می‌شود. نیشکر در خوزستان در واحدهای هفت‌گانه 
شرکت توسعه نیشکر و صنایع جانبی و هم‌چنین شرکت‌های کارون؛ 


کشاورزی وابسته به آن‌ها برای تعیین استراتژی‌های مناسب مدیریتی 
در زمینه وارداتء صادرات و قیمت‌گذاری محصول نیازمند اطلاعاتی 
پیرامون عملکرد محصول هستند. با استفاده از روش‌های داده‌کاوی و 
یادگیری ماشین می‌توان داده‌های مربوط به عملکرد محصول و 
عوامل موثر بر آن را شناسایی و بررسی نمود و مدل‌هایی برای 
پیش‌بینی عملکرد آن ارائه داد که می‌تواند در تصمیم‌گیری‌های 
بلندمدت استفاده شود و رشد و توسعه‌ی اقتصادی و افزایش تولید را 
به ارمغان آورد. هدف این پژوهش ارائه‌ی مدلی برای پیش‌بینی شکر 
استحصالی از نیشکر و بررسی متغیرهای موثر بر آن, با استفاده از 
لگوریتم‌های یادگیری ماشین می‌باشد. مهم‌ترین نوآوری این مطالعه 
درنظر گرفتن هم‌زمان عوامل مدیریتی و آب‌وهوایی در کنار سایر 
عوامل از جمله ویژگی‌های خاک و محصول برای مدل‌سازی و 
پیش‌بینی شکر استحصالی از نیشکر می‌باشد. برای این پژوهش از 
مجموعه داده‌های شرکت کشت‌وصنعت نیشکر امیرکبیر در بازه زمانی 
سال‌های ۱۳۸۹-۱۳۹۶ که شامل ۳۲۲۳ نمونه می‌باشد استفاده شده 
است. 

در پژوهش (2011 ,ع10 > ,۷۲572 ,تتقطل۵ظعع۷) تأثیر 
پارامترهای آب‌وهوایی بر میزان بهره‌وری محصول سویا بررسی شده 
است. در این تحقیق از روش‌های درخت تصمیم (113) برای 
پیش بینی تأثیر پارامترهای آب‌وهوایی استفاده شده است. تحلیل‌های 
درخت تصمیم نشان می‌دهد که بهره‌وری و عملکرد محصول سویا 
به‌طور عمده تحت تأثیر رطوبت نسبی, دما و بارندگی می‌باشد. 

در پژوهش (2014 مطعصله عک بحتعن۷ بنتعقط۵۵2ع۷) از 
رویکردهای یادگیری ماشین برای پیش‌بینی رشد محصول بر اساس 
پارامترهای آب وهوایی استفاده شده است. در این تحقیق نرم افزاری با 
عنوان "۸۵/150۲ 000" با کمک الگوریتم 04.5 تأثیر پارامترهای 
آب‌وهوایی بر عملکرد محصول را بررسی می‌کند و پارامتری که 
بیش ترین تأثیر را بر عملکرد محصول انتخاب شده دارد مشخص 
ی کف 
+2 [1>210 


در پسژوهش 0۵21626۷5108۱ 1) 


(2015 ,مادک رتهعصعه۷/)20عز۳ را‌حلی برای 
مسقله ز منت بزداشت تشک برای. گروهی از تامیت کلتدکارم گنه 
نیشکر کارخانه شکر در کشور تابلند را تأمین می‌کردنده ارائه شد. برای 
کیش عملکرد تیشکز از شیکه‌های غضبی فصتوعی اسشفاده شند. 
برای مدل‌سازی از متغیرهای مختلفی از جمله رقم محصول, نوع 
خاک و میانگین حداقل و حداکثر دمای روزانه استفاده شده است. 

در پژوهش (2017 ,500112065 > ,30662 ,دتزه0۵117 06) از 

۳ ۳ ۱ ۳ ۱ ۳ ۳ 
سه تکنیک یادگیری ماشین رگرسیون بردار پشتیبان جنگل تصادفی 


1- ۸۸۲۱1110121 06۱۷۲۵1 ۵۹ 
2- 12800۳ 51 


نادرنژاد و همکاران. ارائه مدلی داده‌رانه برای پیش‌بینی عملکرد شکر استحصالی از نیشکر ۵۳۷ 


و درخت‌های رگرسیون برای پیش‌بینی میزان شکر استحصالی از 
نیشکر برداشت شده استفاده شده است. نتایج نشان می دهد که مدل 
جنگل تصادفی با کمترین مقدار خطا بهترین روش برای پیش بینی 
می‌باشد. 

در پژوهش (2016 ,۵۸۱ ۶ حصحصداوتت212ظ) از مجموعه‌ی 
داده های هواشناسی شامل: میانگین دماء تراکم ابر دمای روزانه» 
حداکثر و حداقل دماء تبخیر و تعرق بالقوه, تبخیر و تعرق محصول» 
فشار بخار و بارندگی برای پیش‌بینی عملکرد محصولات برنج پنبه 
نیشکر بادام زمینی و ماش سیاه استفاده شده است. الگوریتم های 
استفاده شده برای پیش‌بینی ماشین بردار بق تیاه و بیز تساک و 
روش‌های جمعی ۸25۷1۷ و ۸02۳21۷76 می‌باشد. نتایج نشان 
می‌دهد که روش‌های جمعی ۸25۷1۷ و روش ۸0217۶ نسبت 
به روش‌های ماشین بردار پشتیبان و بیز قابل قبول‌تر هستند. 

در پژوهش 22 رفک عک اناد رتنهبس«مه‌زف۴) 
(2017 از دستگاه‌های اینترنت اشیاء برای جمع‌آوری داده‌های 
کشاورزی و ذخیره‌سازی آن‌ها در فضای ابری استفاده شده است. 
سپس بر مبنای روش‌های داده کاوی پیش‌بینی‌هایی انجام می‌شود. 
هدف نهایی اين تحقیق افزايش تولید محصول و کنترل هزینه‌های 
تولیدی کشاورزی با استفاده از اطلاعات به‌دست آمده از پیش بینی 
می‌باشد. مدل هوشمند کشاورزی پیشنهادی در این تحقیق عملکرد 
محصول را پیش‌بینی می‌کند و تصمیمگیری در مورد توالی بهتر 
محصول بر اساس توالی گذشته محصول در همان مزرعه را با توجه 
به اطلاعات فعلی مواد مغذی خاک انجام می‌دهد. 

در پژوهش (2019 مطقطه عک ,120127 باتطه‌عنط ,عظ۲2) 
سیستم بهینه پیش‌بینی عملکرد محصول با کمک روش‌های 
داده کاوی پیشنهاد شده است. در این تحقیق برنامه مبتنی بر وب 
توسعه داده شده که به کشاورزان برای انتخاب مناسب‌ترین محصول 
برای کشت کمک می کند. این سیستم در مقایسه با سیستم‌های قبلی 
بهتر است و پارامترهای بیشتری را جهت انتخاب محصول بررسی 
می‌کند. پارامترهای مورد بررسی شامل رنگ خاک رطوبت خاک 
میزان ۳ خاک» فصل. بارندگی» دما و آبیاری می‌باشد. بر مبنای این 
پارامترها و با کمک الگوریتم درخت تصمیم 123 سیستم مناسب‌ترین 
محصول را پیشنهاد می‌دهد. 

در پژوهش‌های :2009 ,0۳0675۵ ع ,۴۷۵۲0 ,۳۵۲۲۵۲0) 
,1002 ,9۵08 مطقطومه ۳۷ :2016 رومیاعتم 6 ۳0662 
4 ع]-ظ206) 20164 ,2100061 -صهصرط [ 4 
,6هطاصصض عک راتطم‌ام‌ز؟ ,۱۷۲602 :2018 هه زنمه۱۷۲1۲ 
,۳1۵02۷000 ک بل2عزجم۱۷۱ متصصه‌تطوظ بازه2210012 :2019 
(2019 مدل‌هایی بر مبنای روش‌های یادگیری ماشین برای پیش‌بینی 


عملکرد نیشکر ارائه شده است. جدول ۱ مقاله‌های بررسی شده در این 


مصتطممصه ما۷۵ ٩۱0۵0۲۲‏ -1 
65 ۵۱۷۶ -2 


پژوهش را نشان می‌دهد. همان‌طور که مشاهده می‌شود در بیشتر 
مدل‌ها تمرکز بر پیش‌بینی عملکرد نیشکر می‌باشد و به پیش‌بینی 
شکر حاصل از آن کمتر پرداخته شده است» هم‌چنین تمامی عوامل 
موّثر از جمله عوامل مدیریتی و آب‌وهوایی در کنار هم بررسی 
شکاف‌های تحقیقاتی محسوب شود. در پژوهش‌های بررسی شده 
الگوریتم‌های بوستینگ کمتر از سایر الگوریتم‌ها استفاده شده‌اند و با 
توجه به این که از خانواده یادگیری گروهی هستند می‌توانند از 
الگوریتم‌های تکی عملکرد بهتری داشته باشند و در مدل‌سازی 
استفاده شوند. در پژوهش حاضر مدلی برای پیش‌بینی عملکرد شکر 
استحصالی از نیشکر با در نظر گرفتن عوامل مختلفی از جمله عوامل 
مدیریتی و آب وهوایی با استفاده از رویکردهای یادگیری ماشین ارائه 


شده است. 


مواد و روش‌ها 


ّ 3 9 ۳ ۰ 
مراحل این پژوهش بر اساس گام‌های متدولوژی کریسپ انجام 
شده است. به‌طور معمول از متدولوژی کریسپ برای انجام پروژه‌های 
صنعتی و سازمانی استفاده می‌شوده که به معنی فرآیندهای استاندارد 
صنعتی متقابل برای داده‌کاوی می‌باشد و در واقع چرخه حیات یک 
پروژه را نشان می‌دهد. این متدولوژی از شش گام شامل درک 
موضوع کسب وکار درک و شناخت داده‌هاء آماده‌سازی داده‌هاء؛ 
مدل‌سازی» ارزیابی و توسعه تشکیل شده است. برای انجام پژوهش از 
داده‌های مزارع شرکت کشت‌وصنعت نیشکر امیرکبیر استفاده شده 
است. این مزارع در ۴۵ کیلومتری جنوب اهواز و حدفاصل رودخانه 
کارون جاده اهواز خرم شهر بین طول های جغرفیایی "۱۰ و ۴۸ تا ۲ 
و ۴۸ شرقی و بین عرض‌های ۵۰ و۳۰ تا ۵۰ و ۳۱ شمالی واقع 
۰ مزرعه ۲۵/۵ هکتاری می‌باشد. داده‌های جمع‌آوری شده در بازه 
زمانی سال‌های ۱۳۸۹-۱۳۹۶ می‌باشد. مجموعه داده‌ها شامل ۳۲۲۳ 
نمونه (رکورد) می‌باشد که از یکپارچه‌سازی چهار مجموعه داده شامل 
داده‌های هواشناسی. داده های محصول. داده‌های خاک و داده‌های 
مدیریت مزرعه تشکیل شده است. جدول ۲ توصیف متغیرهای 
(ویژگی‌های) گسسته و جدول ۳ توصیف متغیرهای (ویژگی‌های) 
پیوسته را نشان می‌دهد. متغیرهای حداقل و حداکثر دماء حداقل و 
حداکثر رطوبت نسبی» تبخیر و سرعت باد به‌صورت میانگین در بازه 
میانگین در بازه زمانی مهر-اردیبهشت محاسبه شده است. 


9 عصتصلصه 0202 10۲ 2۳۵۵۵95 0ت2صهاه رتافتالط- و0۵ -3 
0۶19۳-7) 


دم موحتقزر۵ن؟ 231۲ 
1 11۵ ۱۳۵1۲۱۵۵[۵ 11۸۲۱30۵۵۵۵ (2) ۱۵18۸۸ دمتاعمسک چرمتا ود پامهرنه؟ لت تا 8 2898نا من 
9 رمرجهعد؟ زرم مر پهههی وپامسردر رفترر 82 ۵2 تسده بستر88ررمن؟ پجقم مر کصنر8ده عتق6رت2؟ ومنر 
0۳۳0۶3 میس کی)) پچ 6۲ وه کج «(کچوی) «کو که ط ]موه 
رو کودیی جنر مرو موز کشت جنم کت جچی ءزج مقر مس «گتتمتیی کر «جچ ی ود ۲۰ کسعه م۲ 
۱۵۱ کصاوراباه رم ردص ول رتهرمیا ۲ و0 1۸ 


3 
۱۸۵۵7 ۵2 (6۱0) یت 0 0 ]231 


ار ۱0۱۵8 ۰ 1 ۱ ۹ 1 
02۵ ۸۵ ۰۵ (6102) 2 ۱۳۳۳ راهن هه ۵0 و۳۱۵( روتسا دتقجهنو؟ ومزر ردتسل‌متقصنه؟ قمیر ٩۵291۵3۸‏ نمهب تقوم تد۵] ۵۸۱۲۴ 
۳ ۷ 5 0 اب زمر[ يو رم ۳ ج کض جخه) و جرب جنه) جرب او من و کم ۰۲ 
۱ ۱ 20126 ۵1081188 010 ۵۱۵۵ ومیز سامرورمنو؟ ومار وی کدقومن؟ ات۱۱۵8 
8 ۱2 و ۲ 3 0۵ 221 ۳ : 
4 0 شوه ۲ که مج یت ۶ ۳۲۳ و ورز مرو م۲ مرو وم 


منود (ع9۱0) ۱ واه درععع/۵04؟ قمار ۵04 وه ررا2ه۱؟ بجر جزممسیه؟ مرها 204 
وج ‌ 7 ت<اجمنا رمتهوز 9 ۳ و 
600-۵0183 ۲ یچم تن و6 «کتعمتی کر جع مرو 63 ]سم لج) 
اه ار 
9 ود مرول 1۱۵11۴10۷۲ 
۵۵۵ دز ۵ (ع0) 1 ٩0‏ 190[ ۲ ][3* 10۵16133 [201 نف 
#سه 6 0ج و تو متس که ۱۰ 
۱ ۳ ۳ 9 ۳ 
و ۳ ۳۳ ۳۳ ۲ 221300 ۹۵۵0 ,۹۵۵۱۱۳2۱۱۱۲۵ ۵۱۵1۸۸ ودمل وحقومنا مقتقزر۵نا 
مره مر هر (ع۱0) ‌ 4 ِ 1 اجمناومت رمتوعری زجوقلوویرمنا رنووی موجن عمرجمونه پچ کم نزمه زرم ]مسا 79 ]انا سا رهتاگ متقرصنی؟ وم مر ردقنوه مرقکی و نددرک زومرم عم ور 
۳ ۲ رصح( 6 10133۸ ۱۱۵۱6621821؟ ۳ 2 ی 3 
ر جه 6 که جک جک ۵ ۲66 بوسر جک بر کی ؟ آور> کرو ۱۰ 
3 ۱ ان دمن رمدویز ۱ زر دتالد۵۱8۲؟ ۱۱۵116۱۳۵۲ 
+مرتقپاه‌سا ۸۵ 0 (9108) کيمپتم 9و رادومن صای دحقاووورمون تلاصا ] کنو و۸۳ 
ماو زردهنموور۵نا تلووع 
(9۱03) 0006 توقنموورمن چنووی زمره تام ۱321۱۲۵ زر دسلمیهجصنه؟ ونوهیکرورمت هی هد ومز ب رمیسته زرم زرزمتاجا 0[ ات152۵ 
0 0۷ (50151120 جیدا ۷۷۱۵۵۵ 0315000 رو 63 4حصه لمو) جو ۷ و واه کی ری کتنمتی کر 
تجصاجمنا رمتوکو؟ ومل12۵ 10100۸ 
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شکل ۱- هم‌بستگی بین متغیرهای مستقل با متفیر وابسته (درصد شکر استحصالی) 


رواد ماطه۵۵0۷۵) م۷2۲201 )مومع از ممتاهاهز6۵ وعتسناام۲6 ۲۱۵۰1۰ 


شکل ۱ هم‌بستگی متغیرهای مستقل (پیش‌بینی کننده) با متفیر 
وابسته یعنی درصد شکر استحصالی را نشان می‌دهد. که بر اساس 
هم‌بستگی پیرسون محاسبه شده‌اند. همان‌طور که مشاهده می‌شود 
ویژگی‌های درصد خلوص شربت و حداقل دما همبستگی مثبت 
بالایی با میزان شکر استحصالی دارند و هم‌چنین متغیر بارندگی 
بیش‌ترین همبستگی منفی با میزان شکر استحصالی را دارد. 
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آماده‌سازی داده‌ها 

گام سوم در متدولوژی کریسپ آماده‌سازی داده‌ها می‌باشد. در 
این مرحله متناسب با الگوریتم‌های مورد استفاده برای مدل‌سازی 
تغییراتی بر روی شکل داده‌ها انجام می‌شود. از جمله تبدیل 
متغیرهای اسمی و ترتیبی به مقادیر عددی می‌باشد. در این پژوهش 
متغیرهای بافت خاک واریته محصول سن گیاه و ماه برداشت به 


مقدارهای عددی تبدیل شده‌اند. 
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جدول ۲- توصیف متغیرهای پیوسته پژوهش 
۷۲ دنطا 10 ۵0و۱۷ عماطاهتنه۷ دیامیمتاجمی ممتاموتنوعد1 -3 ما20 ] 


جمنامرنتعع0 ۱۲۷2۲۱۵۵16 
متغیر ورودی 
عاطاهنه۷ 00۲ظ] 


متغیر ورودی 
عاطاهنه۷ 00۲ظ] 


میزان کل کود مصرفی برای مزارع که طی ۴ مرحله انجام می‌شود. 


متغیر ورودی 
عاطاهنه۷ 300۲[ 
متغیر ورودی 
عاطاهانه۷ 00۲ظ] 
مساحت قابل برداشت # مصرف آب در هکتار 


متغیر ورودی 
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متغیر ورودی 
عاطاهانه۷ )00ظ] 
متغیر ورودی 
عاطاهنه۷ 00۲ظ] 
مقدار نیشکر برداشت شده از مساحت قابل برداشت 
متغیر ورودی 
عاطاهنه۷ 00۲ظ] 
متغیر ورودی 
عاطاهنه۷ 00۲ظ] 
متغیر هدف 
۷272016 ]12786 
متغیر ورودی 
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متغیر ورودی 
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متغیر ورودی 
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متغیر ورودی 
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متغیر ورودی 
عاطاهانه۷ )1300 


کنیل وگ ها خددی یه مازهای: مایت گس ارس 
نامیده می‌شود. در این پژوهش متغیر شکر استحصالی با توجه به نظر 
خبره شرکت مورد مطالعه به ۲ کلاس مطلوب (۰) و نامطلوب (۱) 
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تقسیم شده است به این ترتیب که مقادیر بیشتر مساوی ٩‏ برای 
درصد شکر استحصالی در کلاس مطلوب و مقادیر پایین‌تر از ٩‏ در 
کلاس نامطلوب قرار دارند. 

با توجه به این که متغیرهای مورد استفاده برای مدل‌سازی مقیاس 
یکسانی ندارنده برای جلوگیری از اين که مقیاس‌های متفاوت لطمه‌ای 


نادرنژاد و همکاران. ارائه مدلی داده‌رانه برای پیش‌بینی عملکرد شکر استحصالی از نیشکر ‏ ۵۵۱ 


به فرآیند تحلیل وارد نکند باید نرمال‌سازی شوند. در نرمال‌سازی 
داده‌ها سعی می‌شود تا وزن یکسانی به کلیه ویژگی‌ها داده شود. 
روش‌های متعددی برای نرمال‌سازی داده‌ها وجود دارد. در این 
پژوهش از روش نرمال‌سازی مین-ماکس" استفاده شده است. این 
روش نرمال‌سازی یک تبدیل خطی را بر روی داده‌های اولیه اجرا 
می‌کند. در این روش یک مقدار از ویژگی ۸ مانند :7 به مقداری 
مانند »2 در محدوده‌ی [ءرمم 2۷2 ,رنم2۵۷] با رابطه (۱) نگاشت 
می‌شود (2019 ,۳61 > ,006۲قک رصقا): 


سوت وم 
زا میلست 2-۳ رز 
27702 


که رم و ونر به‌ترتیب بیش‌ترین و کم‌ترین مقدار موجود 
برای ویژگی مورد نظر 9 برمیم ۵۱۷ ۷[ 9 ۵۱۷ 1۷ محدوده جد ید انتبت 
که در اینجا بازه [0,1] می‌باشد. 


الکوریتم‌های یادکیری ماشین 

برای مدل‌سازی این پژوهش از چهار الگوریتم یادگیری ماشین 
استفاده شده است که در ادامه معرفی می‌شوند. متغیرهای پیوسته و 
پیش‌بینی کلاس‌های تعیین شده برای شکر استحصالی از نیشکر 
استفاده شده است. 


ماشین بردار پشتیبان 

ماشین بردار پشتیبان به‌طور ذاتی یک دسته‌بند دودویی است که 
یک خظ یا ابر صفحه جداکننده برای طبقه‌بندی داده‌های نمونه 
می‌سازد. قابلیت طبقه‌بندی ماشین بردار پشتیبان سنتی را می‌توان 
به‌وسیله‌ی تبدیل فضای ویژگی‌های اصلی به فضای ویژگی با ابعاد 
بالاتر با استفاده از حقه کرنل" به‌طور اساسی افزایش داد. ماشین بردار 
پشتیبان برای یادگیری از توابع خطی استفاده می‌کند در برخی از 
موارد غیرخطی» ماشین بردار پشتیبان از تکنیک کرنل برای نگاشت 
کردن داده‌ها در فضای ویژگی با ابعاد بالا استفاده می‌کند که توابع 
خطی می‌توانند به کار برده شوند ۴۵۱20۷۵1 :2018 ,.اه ۶1 دمعلهن]) 
(2019 مصقصهه هناگ ک. 
جنگل تصادفی " 

جنگل‌های تصادفی از الگوریتم‌های یادگیری گروهی هستند که 
می‌توانند برای مسائل طبقه‌بندی و رگرسیون استفاده شوند. مزست 
کلیدی جنگل تصادفی این است که می‌تواند روابط غیرخطی و سلسله 
مراتبی را بین متغیرهای پیش‌بینی‌کننده و متغیر پاسخ با استفاده از 
رویکرد یادگیری گروهی بررسی کند. مدل جنگل تصادفی گروهی از 


1 - ]۷]10-- 
2-6261 1 
3- 12000۳ ۲ 


درختان تصمیم می‌باشد که هر درخت تصمیم با مجموعه‌ای از داده‌ها 
که به روش نمونه‌برداری با جایگذاری (تکنیک بوت‌استرپ)" انتخاب 
شده‌اند آموزش داده می‌شود. برای ساخت هر درخت در هر مرحله 
زیرمجموعه‌ای از ویژگی‌ها به‌صورت تصادفی انتخاب شده سپس بر 
اساس معیارهای متفاوتی مثل سنجه جینی" بهترین ویژگی برای 
تفکیک داده‌ها از زیر محموعه تصادفی از ویژگی‌ها انتخاب می‌شود. 
این سنجه ناخالصی نمونه‌ها را در مجموعه « بر اساس رابطه (۲) 
محاسبه می‌کند: 
(۲ 21-2 ()نون6 
که در آن :م احتمال تعلق یک نمونه در مجموعه ظ را به کلاس 
6 نشان می‌دهد و برای هر ویژگی هرچه مقدار آن کمتر باشد یعنی 
آن ویژگی اطلاعات بیشتری را به ما می‌دهد و برای تفکیک انتخاب 
می‌شود (2019 .41 07 1120). برای پیش‌بینی نمونه‌های داده آزمون. 
ابتدا پیش‌بینی هر درخت انجام می‌شود و سپس همه پیش‌بینی‌ها 
ادغام شده و رای‌گیری با رویکرد سهل‌گیرانه يا سخت‌گیرانه انجام 
می‌شود و پیش‌بینی نهایی اعلام می‌شود .۵ 6 حدطعد۲۷۵) 
(2016. 


بوستینگ 

بوستینگ یکی از تکنیک‌های یادگیری گروهی است که تلاش 
می‌کند دسته‌بندی قوی از تعدادی دسته‌بند ضعیف (یادگیرنده 
ضعیف ) ایجاد کند. این کار با ساخت یک مدل از داده‌های آموزش» 
سپس ایجاد یک مدل دوم که سعی می‌کند خطاهای مدل اول را 
اصلاح ِ انجام می‌شود. در واقع در بوستینگ برخلاف روش‌های 


بکیتگ مانق کل تاش بل فا سور تن شاه تین وگ 
بلکه به‌طور متوالی ساخته می‌شوند. آدابوست" اولین الگوریتم موفق 
بوستینگ است که برای طبقه‌بندی‌های باینری (دودویی) توسعه داده 
شده است. آدابوست مخفف بوستینگ تطبیقی بوده که توسط یاو 
فروند و رابرت شاپیر " ابداع شد. در واقع آداپوست یک متا الگوریتم "! 
است که برای ارتقای عملکرد همراه دیگر الگوریتم‌های یادگیری 
استفاده می‌شود. در اين الگوریتم دسته‌بندی در هر مرحله جدید بر 
ماش تمونتهای غلط هی عفر مراحل فا ای ی کرو 
در الگوریتم آدابوست در هر دور یک دسته‌بند ضعیف اضافه می‌شود. 
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در هر مرحله دسته‌بند پایه فقط کافیست از دسته‌بند تصادفی (۸۵۰/) 
پهتر باشد (1997 ,عتنمدط5 24 صنهع۳۲) 


گرادیان بوستینگ 

گرادیان تقویتی" یکی از الگوریتم‌های یادگیری ماشین است که 
برای مسائل طبقه‌بندی و رگرسیون به‌کار می‌رود. یک مدل پیش‌بینی 
در قالب گروهی از یادگیرنده‌های ضعیف ایجاد می‌کند که معمولا 
پاذگیرنده‌ها درختان تصمیم فتند. مدل‌سازی همانند دیگر روش‌هاین 
بوستینگ به شکل مرحله‌ای می‌باشد. این الگوریتم مشابه پوستینگ 
تطبیقی می‌باشد اما از جنبه‌های خاصی با آن متفاوت است. در واقع در 
این روش مسئله بوستینگ (تقویتی) به‌عنوان یک مسئله بهینه‌سازی 
مطرح می‌شود. یعنی در هر مرحله تابع ضرری در نظر گرفته می‌شود 
و هدف بهینه‌سازی آن می‌باشد. اين ایده اولین بار توسط بریمن" 
توسعه داده شد. الگوریتم تقویت گرادیان حداکثری؟ (20050050) از 
دسته الگوریتم‌های گرادیان تقویتی و الگوریتم‌های گروهی می‌باشد 
که می‌تواندبرای مسائل رگرسیون و طبقهیندی استفاده شود. الگوریتم 
1 به دلیل سرعت بسیار بالا در مقایسه با سایر الگوریتم‌های 
گرادیان بوستینگ و عملکرد بسیار خوبی که دارد بسیار محبوب است 


و هم‌چنین در مسابقات یادگیری ماشسین استفاده می‌شود 
(2020 ,6ع۲۵0۳/8۱ظ). 


مدل‌سازی 

مدل‌سازی این تحقیق با زبان برنامه‌نویسی پایتون نسخه ۲,۸,۶ و 
در محیط ژوپیتر نوت‌بوک انجام شده است. برای مدل‌سازی داده‌ها با 
۰6 ۰ ۴ ۰ ۰ ِ ۰ 1 ۳ 
تکنیک هلداوت به‌صورت تصادفی به دو مجموعه مستقل آموزشی و 
آزمایشی تقسیم شده‌اند. معمولا دو سوم داده‌ها به مجموعه‌ی آموزشی 
و یک سوم باقی‌مانده به مجموعه‌ی آزمایشی تخصیص داده می‌شود. 
مجموعه داده‌های آموزشی برای ساخت مدل و مجموعه داده‌های 
آزمایشی برای ارزشیابی مدل استفاده می‌شود (2019 ,.۵1 6 ح۳12). 
در این پژوهش ۷۰ درصد از داده‌ها برای آموزش و ۳۰ درصد برای 
آزمایش استفاده شده‌اند. برای تنظیم و به‌دست آوردن مقادیر بهینه 
هایپرپارامترهای الگوریتم‌ها از روش جست و جوی شبکه‌ای" به 
همراه اعتبارسنجی متقابل استفاده شده است. جدول ۴ 
هایپرپارامترهای تنظیم شده به همراه مقدارهایشان را نشان می‌دهد. 


عصتاد000 م0201 -1 

2- 

عصاده0 اصمنلهع م۲2۲6 -3 
1۵0۲ -4 

5- 0110 


برای ارزیابی مدل‌های ساخته شده از سنجه‌های صحت. دقت. 


فراخوانی و امتیاز ۳1 و هم‌چنین اعتبارسنجی متقابل داده‌ها استفاده 
شده است. روابط (۳) تا (۶) سنجه‌های استفاده شده را نشان می‌دهند. 


)۳ ۷ < صحت 
(۴) سل < دقت 
رد 
ی 
(۵) < فراخوانی. حساسیت 
1 _ .۱ 
( ۱ امتیاژ ۳ 


در روابط بالا ۳ و لا به‌ترتیب تعداد کل نمونه‌ها در کلاس مثبست 
و ملفی آشاره می‌کند. درست مت (۲۳) ؛ این اصطلاح اشاره ببه 
تعداد نمونه‌هایی دارد که در کلاس مثبت هستند و توسط دسته‌بند 
به‌درستی برچسب خورده است. درست منفی (1(۷) این اصطلاح 
اشاره به تعداد نمونه‌هایی دارد که در کلاس منفی هستند و توسط 
دسته‌بند به درستی برچسب منفی خورده است. تادرست مقیت (0۳۳۴ 
تعداد نمونه‌هایی هستند که در کلاس منفی قرار دارند اما به نادرست 
برچسب مثبت خورده‌اند. نادرست منفی 2۳۳ تعداد نمونه‌هایی 
هستند که در کلاس مثبت قرار دارند اما به نادرست برچسب منفی 
خورده‌اند. معیار صحت کارایی کلی مدل را می‌سنجد. سنجه‌های دقت 
و حساسیت به‌صورت گسترده‌ای در دسته‌بندی استفاده می‌شوند. 
سنجه دقت به‌عنوان یک سنجه درستی در نظر گرفته می‌شود 
(درصدی از نمونه‌ها که مثبت برچسب‌گذاری می‌شوند و واقعا کلاس 
آن‌ها مثبت است) و سنجه فراخوانی یک سنجه تمامیت است 
(درصدی از نمونه‌های کلاس مثبت که به درستی دسته‌بندی 
می‌شوند) و با سنحه حساسیت برابر است. سنجه امتباز ۳1 میانگین 
هارمونیک " دو سنجه دقت و فراخوانی است. در فرمول آن وزن 
یکسانی به دقت و فراخوانی تخصیص داده شده است ,.۵1 6 ۳120) 
(2019. جدول ۵ نتایج مدل‌های ساخته شده برای پیش‌بینی شکر 
استحصالی را نشان می‌دهد. سنجه‌های دقت. حساسیت و امتیاز ۳۱ 
برای مجموعه آزمایشی و سنجه صحت برای مجموعه آموزشی و 
آزمایشی محاسبه شده است. مقادیر جدول بر اساس درصد می‌باشند. 


6-7] 6 
7- 7] ۲16 6 
8- ۲۵۱6 6 
9- ۳۵16 6 
10-۵۵6 


نادر نژاد و همکاران. ارائه مدلی داده‌رانه برای پیش‌بینی عملکرد شکر استحصالی از نیشکر ‏ ۵۵۳ 


۵۹ محصطا تجمعله 0۶ 1060 -4 1016 
مقدار تنظیم‌شده هایپرپارامترها با روش جست‌وجوی شبکه‌ای به‌همراه اعتبارسنجی متقابل 
مومی- نع 0۵)60ناه۲-عومن ها عمامههص ص۲۲ 
تعداد درختان : تعداد درختان تصمیم در جنگل ۱۰۰ 

۲۰ 3۵ 1 وعع۲) 0۶ تهطاحصتاط فظ[ 
حداکثر عمق درخت: 66۷ ۱06 0۶ 0601۳ نفد م1 
حداقل نمونه در گره برگ: کم‌ترین نمونه لازم در گره که برگ محسوب شود. ۱۲ 
6 162 2 2 0۵ ۲0 1۲60۱۲۲۵0 165مصصقه ۵۶ تعجاصصتاط مرتاحصتصتمط مط ]1 
حداکثر ویژگی‌ها: بیش‌ترین تعداد ویژگی‌هایی که هنگام جست‌وجوی بهترین تقسیم باید در نظر گرفته شود ۸ 
اجعها معط 0۲ همتان10 ممطه تمل‌تفجمی ما فعتنااوع؟ ۵۶ تمطاصصتاه مط ]1 
تعداد مدل‌ها: تعداد مدل‌هاپی که فرآیند آموزش را تکرار می‌کنند. ۵۰ 
۵ ۵ و1 وصتاون0 طمتطاه کج عرمتمصتایی ۵۶ تمطاصصته متام 927 مط ]1 


نرخ یادگیری: سهم هر طبقه‌بند در وزن‌ها در هر دور را کنترل می‌کند. توازنی بین میزان یادگیری و تعداد دورها (طبقه‌بندها) وجود دارد. ۰,۲۵ 


6 1621۳0108 و0 0۱295110۲ طمهه ۶ ممتبطتنومع مطا معاصتنطه ملع عصتصنهم [ 
تعداد مدل‌ها: تعداد درختان تصمیم در جنگل (تعداد دفعات یادگیری مدل) ۴۵ 
106 عصتاوممها ۵۶ مایا 
حداکثر عمق درخت: ۳ 
نرخ بادگیری: کنترل وزن مدل‌ها در هر دور ۰,۱۷ 

216 6210118[ 
کرنل: هسته, جداسازی کلاس‌ها در فضای داده‌هاء خطی 
حصطاجمعله مطا صذ 5۵0 ۵ ما و0 اعصی! عمط معتل0ع0٩‏ 


تمامصصهنه0 ۵۵۱1211221101 


جدول ۵- نتایج ارزیابی مدل‌ها 
900618 0۶ ۲680166 -5 12010 


الگوریتم 


عصطانهعاض۸ 


جنگل تصادفی 


[2۱0101 06۲ 


آدابوست 
۸012۳00 


تقوبت گرادیان حداکثری 
2-21 


ماشین بردار پشتیبان 
320 


امتیاز ۲1 فراخوانی دقت صحت مجموعه آزمایش صحت مجموعه آموزش مدل 
6 ۳1 االتعتی م۳6 اه ۸2 صنحتا سیخ 0001( 
15 6 85 923 937 جنگل تصادفی 
4۹ 
16 617 817 924 926 آدابوست 
1( 
/ 12 81 921 948 تقویت گرادیان حداکثری 
۹6 
ماشین بردار پشتیبان 
14 97 ره 92 925 شین بردار پشتیبان 
۸0 


همان‌طور که جدول ۵ نشان می‌دهد بر اساس سنجه صحت 
امتیاز مدل‌ها بسیار نزدیک به‌هم و با تفاوت ناچیزی مدل آدابوست 
عملکرد بهتری دارد. هم‌چنین بر اساس معیارهای دقت و فراخوانی 
به‌ترتیب مدل‌های آدابوست و ماشین بردار پشتیبان عملکرد بهتری 
نسبت به سایر مدل‌ها دارند. بر اساس معیار ۳1 مدل‌های آدابوست و 
تقویت گرادیان حداکثری با تفاوت ناچیزی نسبت به مدل‌های دیگر 
عملکرد بهتری دارند. 


اعتبارسنجی متقابل 
اعتبارسنجی متقابل یکی از روش‌های ارزیابی مدل می‌باشد که 


تعیین می‌کند نتایج مدل ساخته شده بر روی یک مجموعه داده تا چه 
اندازه قابل تعمیم و مستقل از داده‌های آموزشی است. در اعتبارسنجی 
۱ 

متقابل که همراه با پارمتر ۸ استفاده می‌شود. داده‌های اولیه به‌صورت 
تصادفی به / زبرمجموعه تقسیم می‌شوند. هر دفعه یک زیر مجموعه 
برای اعتبارسنجی و 1-1 تای دیگر برای آموزش به‌کار می‌رود. در 
نهایت میانگین این 6 اعتبارسنجی به‌عنوان امتیاز نهایی اعلام 
می‌شود. 


1- 1-010 0۳085-71102 


۳ نشریه ماشین‌های کشاورزی. جلد ۱۲ شماره ۰۴ زمستان ۱۴۰۱ 


جدول - نتایج اعتبارسنجی متقابل 
طمتاعل تج ۷-جومین 10-۲010 0۲ ۵9۷1۲ -6 12016 


انحراف استاندارد صحت مدل 
۵۵۵ 200270 ۵( ۷0061 
0011 921 ای 
8۳ 
0012 922 ات 
7۰ 
تقوبت گرادیان حداکثری 
0013 919 
6100« 
ماشین بردار پشتیباه 
0013 923 ین پردر پشتیبان 
3/0۵ 
2۷ 2468002 اومه 96و8۵ ۲ 


شکل ۲- نمودار جعبه‌ای اعتبارسنجی متقابل مدل‌ها 
صمناملنله۷ عومن 0160و 10-1010 من وممرازدعهاه 21 0۲ وعمعو 0۲۷ 0۲ ٩0۵0:۵10۲‏ ۲12,2۰ 


0 2 )۱2۲6۵ و۵ 6۵ اه میا ۵ له اما مص] 
5 2 ااع 
7 2 00۳0168 
[63 ,61] < ۷۵۱۷6 
مهد < عععاه 


شکل ۳- بخشی از درخت تصمیم شماره ۱ از مجموعه درختان تصمیم جنگل تصادفی 
جمتامع6011 0665 06015101 ۳۵۲۵6۲ ممصق فطا رم ۱0.1 معا مملفمع0 0۲ ۲2۲۲ ۲1۵.3۰ 


نادرنژاد و همکاران. ارائه مدلی داده‌رانه برای پیش‌بینی عملکرد شکر استحصالی از نیشکر ‏ ۵۵4 


94 6 
94. 500 
23.4 
16.500 


16-۰00 


23.54 
0.36 
۳ 
09.36 


94-500 
23.54 
14. 3 
۳ 
14.3 


234 
2-۰200 


2-۰-00 


4 طاومه ۶ه طعصوعط 260مطاع تس | 


4 طاوعه ۶ه طعصععط ۱202060 ست | | 


4 طاوعه ۶ه طعصععط 02۲60 هط ست | | 


3 طاوعه ۶ه طعصععط 02060 هط سا ۱ 


2 طاوعه ۶ه طعصععط 02260ها ست زا 


جدول ۷- قوانین استخراجی از درخت تصمیم شماره ۱ از مجموعه درختان تصمیم جنگل تصادفی 


جمتاعع۵1 عهعا طمنمزعع0 ]و۲0۲۵ مطرم12 عط) رون را 
۳ 

4 ح> طوذتهتنه ط0عوعو ووعن -- ۱ 
عک> ع۵طاا۵۳۵۵1۲ 101 س- 

3 ح> و0211 طهفوعو ووعن0 سب ۱ 1 ۱ 


3 < صوذتوعتته ووفووهو و6۲0 -- ا ا ا 


۵۳۲۵۵۲۵۵ 1011 تس 
ح> 01 1]211 603101 -- | 1 ۱ 
98 | | | ا ا 

< ناه هم | | | 


4 < طوتعوعنه ط0عوعو ووعن -- 1 

عک> ۵۳۵۵1۲۵۲۵ 11 س- 
0 > طظ0 0۴9۳۵۲1 ۵161 10۳۵1 -- | 1 1 [ 
98 ۱-2 | | ا ا 
0 < طظ0 ۵۲1 9ط60 ۵161 10۳۵1 -- | 1 1 [ 


< ۵۳۲۵۵1۵۵ 101 تس 
ح> طووو(ددد وعصل۲ | | | | 


< طون و11 فوصت --| .| .| | 
0 01299 | | | | ا 


0 ۲۳68 ط0910عع0 حطمن مملن طمت۲:۵۵ -7 12۳016 
946 <> ۷ نا --| 
83.559 ح> 2311۷7 --|] ۱ 
0 .> 01 001211 ط0قوهو ووطن -- | ۱ 1 
0 :61899 | | | ا 
0 0 1 0 ۰ 0۴10۳8 -- | ۱ 1 
2 << 90621 طووز طم ۲1 متا 9ط6۵ 61 21 -- | ۱ [ 1 
3 طاوع ۶ طم‌صحدط ۵0همصا ححا ‏ ا ‏ | | 
2 ۱ ۴ هو وود ما وطوی . 2۵۵ حح لا .| 
2 طاوع ۶و طم‌صحدط ۵0همصا ححا ‏ ا ‏ | | 
و83 < 0211۷ | ۱ 
> اوه۲تطقط و(وعه ۲۵ ۶۴ه وصذلاعه ۶ه 1۳۲۵۳721 11۳6 --| 1 ۱ 
0 << 
9 -<> (1601) 71610 --| ۱ ۱ 1 
2 طعوعه ۶ه طم‌صوعط ۵0 هماع ححا ‏ ا ‏ ا | ]| 
9 5 (ط16) 71610 --| [ [ 1 
2 طاوع ۶ طم‌صحدط ۵0همصا خحا ‏ ا ‏ ا ‏ ا. | 
< اوه7تحقط ومعم متا ۶۴ وصذلاعه ۶ه 1۳۲6۳0721 11۳6 --| 1 ۱ 
99۰.000 
2 > ۵۲0۵۲۵۵ 1/2 | .| | | 
0 *99ع1ه | | | | ا 
2 < ۵۲0۵1۵۵ 1/2 | ...| | | 
0 618299 ح| | | | | 


یلا۳۳ برازررم 
7 اءعب327 م۲۵ ۱۵ ؟آه وطترصل آه ادبمعاطا 71۳08 


ا.. ۱ 
۳ ادهبدظ اه طامه۱ 
۳ ۳۵۵۲۵ ۱۲ 

۸ «هتاوینت «0عقود 06۲۵۵ 
1 و۸ 
7 ۳۳:10 
قط ۷۲۳9۵0 1۲1۳0۵2 
۸ ۲2۳227 اههنعط0 
| ۱۰-8 
صهنادانم‌نه۴ 
۵۲ 08۲ 00۳5۲۱۵/۵0 ۱۷۵16۲ 
ات۱ 
و۱ 
۷۵ 5۱ 
دجومه ۷۷۱80 
۲۷۵00۲۵ 
۷ ۲۵۱۵۱۶9 ۱۸۵ 
وبناداوم ۱۸۶ 
۱2۵۵۲۵۵ ۱۱2 
انم ۲26۵ 
۳۳۵000 


0 20 40 0 20 100 


۲2۱217۷۶ ۵۶ 


شکل - اهمیت متغیرها در مدل آدابوست 
6۲ ۸02۳8005 عصتفدا معس2ع] 23 0۶ معصم)1۳00۲ ۲62 ۲1۵,4۰ 


اک تراسا با بشش‌ها به کویدای اصاب شوند که #زيع 
کلاس نمونه‌ها در هر بخش به صورت تقریبی یکسان باشد. 


اعتبارسنجی 


متقابل و طبقه‌بندی شده" نام دارد (2019 .۵1 61 ۲1۵). 


در این پژوهش برای ارزیابی مدل‌های ارائه شده برای پیش‌بینی شکر 


استحصالی» | 


ز‌ اعتبارسنجی متقابل و طبقه‌بندی شده داده‌ها با ۱۰ لایه 


و ۲ تکرار و معیار صحت برای ارزیابی مدل‌ها استفاده شده است. 
جدول ۶ نتایج اعتبارسنجی متقابل مدل‌ها را برای پیش‌بینی شکر 


1- 902111160 00۹9-100 


استحصالی می‌باشد. شکل ۲ نمودار جعبه‌ای ارزیابی مدل‌ها با روش 
اعتبارسنجی متقابل را نشان می‌دهد. 

شکل ۲ سه سطح از درخت تصمیم شماره یک از مجموعه ۱۰۰ 
درخت ساخته شده در مدل جنگل تصادفی را نشان می‌دهد. از 
شاخص جینی برای تقسیم‌بندی استفاده شده و ویژگی‌هایی که به 
ريشه درخت نزدیک‌تر هستند اهمیت بیشتری دارند. هم‌چنین در 


۶ نشریه ماشین‌های کشاورزی. جلد ۱۲. شماره ۰۴ زمستان ۱۴۰۱ 


جدول ۷ محموعه قوانین استخراج شده از این درخت را در سه سطح 
نمایش می‌دهد. 

شکل‌های ۴ و ۵ میزان اهمیت متغیرهای استفاده شده برای 
مدل‌سازی درصد شکر استحصالی را به‌ترتیب برای مدل‌های آدابوست 


متغیرهای درصد خلوص شربت. فاصله زمانی قطع آب تا برداشت 
ول رل یل راو کل آبعضرزنی مر اد بای یره 
می‌باشند. 
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شکل ۵- اهمیت متغیرها در مدل جنگل تصادفی 


6۲ ۳0۲۵۹ جطمصقک عصتفدا وعت2ع] 23 ۵۲ ممصما01م1۳ متناامع۲ ۲1۵۰5۰ 


نتبجه گیری 


در این مطالعه رویکرد جدیدی مبتنی بر روش‌های یادگیری 
ماشین برای پیش‌بینی شکر استحصالی از نیشکر ارائه شد. برای 
مدل‌سازی داده‌ها به دو دسته آموزشی و آزمایشی تقسیم شدند. ۲۲۵۶ 
نمونه که ۷۰ از داده‌ها را شامل می‌شود در مجموعه آموزشی و ۹۶۷ 
نمونه که ۳۰ داده‌ها می‌باشد برای مجموعه آزمایشی در نظر گرفته 
شد و سپس مدل‌های ساخته شده با سنجه‌های متفاوتی بر روی 
محموعه داده آزمایشی ارزیابی شدند. نتایج نشان می‌دهد که عملکرد 
همه مدل‌ها قابل قبول می‌باشد و می‌توان از روش‌های یادگیری 
ماشین و الگوریتم‌های یادگیری جمعی برای پیش‌بینی استفاده نمود. 
نتایج حاصل از بررسی اهمیت ویژگی‌ها نشان می‌دهد متفیرهای 
درصد خلوص شربت» طول فصل زراعیء فاصله زمانی قطع آب تا 
برداشت محصول, ماه برداشت و حداقل دما از متغیرهای مهم و 
تأثیرگذار بر عملکرد شکر استحصالی می‌باشند. در پژوهش‌های 
گذشته نتایج حاصل از بررسی متغیرهای موثر بر عملکرد شکر 
استحصالی از نیشکر متفاوت می‌باشند. برای مثال در پژوهش 
(2009 ,.1 1 ۳6۵۲۲۵۲0) متغیرهای رقم محصول و سن محصول 
بیش‌ترین آهمیت را بر عملکرد شکر استحصالی از نیشکر داشته و 


میزان بارندگی کم‌اهمیت‌ترین متفیر بوده است. در پژوهش دیگری 
(2017 ,.۵1 ۶ 011۷61۳2 06) متغیرهای آب‌وهوایی از جمله محموع 
درجه حرارت روزانه و حداقل دما بیش‌ترین اهمیت را بر عملکرد شکر 
استحصالی از نیشکر داشته و متغیرهای مربوط به خاک از جمله نوع 
خاک اهمیت کمتری داشته‌اند. نتایج حاصل از این مطالعه و تحلیل 
قوانین به‌دست آمده از مجموعه ۱۰۰ درخت تصمیم ساخته شده در 
مدل جنگل تصادفی می تواند برای مدیران کشت‌وصنعت‌های مختلف 
در تعیین استراتژی های مناسب و آماده سازی شرایط برای دستیابی به 
تولید مطلوب و بهینه استفاده شود. 


پیشنهادها 


برای پژوهش‌های آینده و هم‌چنین سیاست‌گذاری و تصمیم‌گیری 
شرکت کشت وصنعت نیشکر امیر کبیر پیشنهادهایی به شرح زیر ارائه 
هی شوه 
۷ در تحقیقات آینده می‌توان از تعداد نمونه‌های بیشتر استفاده 
شود که نتایج با اطمینان بیشتری حاصل شود. 
۲" هم‌چنین می‌توان از روش‌های یادگیری عمیق و تحلیل 
سری‌های زمانی و پردازش تصویر استفاده شود. 


نادرنژاد و همکاران. ارائه مدلی داده‌رانه برای پیش‌بینی عملکرد شکر استحصالی از نیشکر ۵۵۷ 


_ ترکیب الگوریتم‌های یادگیری ماشین با یک‌دیگر و مقایسه با سباسگزاری 
مدل‌های ارائه شده در پژوهش حاضر به‌منظور دستیابی به 


7 استفاده از تجهیزات اینترنت اشیاء برای جمعآوری و پردازش 
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